\section{Preguntas Claves y Objetivos}
\label{objetivos}

El objetivo clave de la presente propuesta de investigaci\'on es desarrollar un sistema capaz de entender instrucciones dadas en lenguaje natural (ej, espa\~nol) que est\'an situados en un ambiente f\'isico o virtual. El sistema que buscamos no solo interpretar\'a sino que tambi\'en llevar\'a a cabo, en tiempo real, las instrucciones. La Interpretaci\'on Situada de Instrucciones es un problema complicado debido principalmente a dos razones. En primer lugar, los lenguajes naturales son inherentemente ricos: la misma intrucci\'on puede ser dicha de infinitas formas distintas. Segundo, el lenguaje situado es el\'iptico no solamente al discurso previo sino tambi\'en a las oportunidades salientes de la situaci\'on: si hay una \'unica cosa sobresaliente para hacer, una instrucci\'on como {\em ``hazlo''} o simplemente {\em ``si''} es probablemente suficiente para convencer a una persona de realizar la acci\'on.

Pensamos atacar el problema de interpretar una frase $u$ en una situaci\'on $s$ ubic\'andola dentro de un problema de clasificaci\'on probabil\'istica: de todas las reacciones {\em posibles} desde $s$, ¿cu\'al es la reacci\'on que tiene la mayor probabilidad de ser una reacci\'on a $u$? Este acercamiento presenta las siguientes interrogantes:


\begin{description}
\item[Modelado de Situaci\'on] ¿C\'omo calculamos las acciones posibles desde una determinada situaci\'on? ¿Cu\'al es el nivel de granularidad en el cual debemos modelar estas acciones? ¿C\'omo podemos modelar la saliencia de las acciones posibles observando interacciones humano-humano en el dominio?
\item[Clasificaci\'on] ¿C\'omo podemos rankear las acciones posibles de acuerdo a su saliencia y su probabilidad de ser una reacci\'on a una determinada frase? ¿Cu\'ales son las caracter\'isticas relevantes (de la frase y de la situaci\'on) para entrenar el clasificador en interacciones humano-humano?
\item[Administraci\'on de malos entendidos] En caso de un mal entendido, ¿c\'omo puede el sistema actualizar la distribuci\'on de probabilidad de su interpretaci\'on original basado en la correcci\'on recibida?
\item[Modelado de usuario] ¿Cu\'ales son las caracter\'isticas relevantes de la interacci\'on con un usuario particular que ayude a re-analizar nuestras interpretaciones potenciales? ¿Modelar expl\'icitamente el terreno com\'un con el usuario~\cite{clark_1996} ayudar\'ia a entenderlo mejor? ¿Puede mejorarse la interpretaci\'on mediante modelos predictivos estad\'isticos para modelar usuarios~\cite{zukerman-albrecht:PSMFUM}?
\end{description}

En nuestra concepci\'on actual acerda de c\'omo deber\'ia evolucionar este proyecto, hay dos puntos principales en torno a los cuales toda pregunta deber\'ia ser considerada: el uso de {\em datos baratos}, y el asunto de la {\em reversibilidad}.

Para el primero, obtendremos un sistema capaz de aprender autom\'aticamente c\'omo interpretar instrucciones sin requerir anotaci\'on manual (a diferencia de los enfoques estad\'isticos t\'ipicos, donde la anotaci\'on manual es siempre requerida de un modo u otro). Lograr este objetivo nos permitir\'ia hacer uso de una gran cantidad de corpora de instrucciones e interacciones, dado que tal corpora no puede ser utilizado actualmente debido a la magnitud del esfuerzo que requerir\'ia anotarlo.

Finalmente, el segundo punto, y quiz\'a uno de los asuntos m\'as complejos que pensamos encarar es la {\em reversibilidad}: ¿podemos unificar el modelo interno de un sistema de interpretaci\'on de instrucciones con el modelo de un sistema de generaci\'on? Dado que ambos sitemas requieren acceso a un corpos similar de entrenamiento y ambos considerar un acercamiento similar hacia el entendimiento del entorno, tener un modelo de probabilidades compartido (es decir, el model a trav\'es del cual predeciremos los resultados de una determinada acci\'on, ya sea porque el sistema quiere predecir c\'omo reaccionar\'a un usuario a una instrucci\'on o porque el sistema recibi\'o una instrucci\'on y necesita seleccionar la reacci\'on apropiada) ser\'ia de gran utilidad, ya que ser\'ia el primer paso hacia un sistema conversacional completo. La pregunta de si tal modelo compartido puede obtenerse es una que pretendemos responder en este proyecto.